15/02/2021

Obiettivo

L’attuale epidemia di Covid-19 ha avuto un impatto senza precedenti nel settore del trasporto aereo.

A partire da fine gennaio 2020 molte nazioni hanno cominciato a bloccare i voli provenienti da alcuni paesi dell’Asia e successivamente, con la diffusione della pandemia anche in Europa e in America, il blocco ha riguardato anche i voli in partenza. Di conseguenza l’aviazione è uno dei settori che più ha sofferto e soffre tutt’ora a causa delle conseguenze della pandemia.

Secondo ACI World (Airport Council International, organizzazione fondata del 1991 per rappresentare gli interessi degli aeroporti presso i governi) nel 2020 c’è stata una riduzione del 64.2% del traffico passeggeri globale che corrisponde a oltre 6 miliardi di passeggeri in meno rispetto alle previsioni pre Covid-19. Secondo ciò che riporta International Air Transport Association le compagnie aeree hanno perso almeno 84,3 miliardi di dollari nel 2020 e nel 2021 ne perderanno almeno 15,8 miliardi.

In questo studio è analizzata una rete di trasporto aereo con dati riferiti ai mesi di gennaio, febbraio e marzo 2020 e l’impatto che il Covid-19 ha avuto su tale rete.

Il dataset

Il dataset scelto è stato creato da Xavier Olive, Martin Strohmeier e Jannis Lübbe a partire da dati derivati dalla piattaforma The OpenSky Network 2020 con l’obiettivo di illustrare la variazione del traffico aereo durante la pandemia Covid-19.

Per ogni mese è stato creato un file .csv in cui ogni riga contiene le informazioni su un volo specifico.

Ogni file .csv contiene i seguenti attributi:

  • callsign: l’identificativo del volo visualizzato sugli schermi ATC (di solito le prime tre lettere sono riservate a una compagnia aerea specifica: AFR per Air France, DLH per Lufthansa, ecc.);
  • number: numero commerciale del volo;
  • icao24: numero identificativo univoco del transponder (dispositivo radio che permette la comunicazione con gli addetti del controllo dello spazio aereo);
  • registration: il numero di coda dell’aeromobile (quando disponibile);
  • typecode: il tipo di modello del velivolo (quando disponibile);
  • origin: codice di quattro lettere che identifica l’aeroporto di origine (quando disponibile);
  • destination: codice di quattro lettere che identifica l’aeroporto di destinazione (quando disponibile);
  • firstseen: il timestamp del primo messaggio ricevuto dalla piattaforma OpenSky Network per il volo;
  • lastseen: il timestamp dell’ultimo messaggio ricevuto dalla piattaforma OpenSky Network per il volo;
  • day: giorno in cui è avvenuto il volo;
  • latitude_1, longitude_1, altitude_1: prima posizione rilevata del volo;
  • latitude_2, longitude_2, altitude_2: ultima posizione rilevata del volo.

I tre dataset riferiti ai mesi di gennaio, febbraio e marzo 2020 sono stati uniti in un unico dataset chiamato df_flight_covid.

## # A tibble: 3,921,109 x 16
##    callsign number icao24 registration typecode origin destination
##    <chr>    <chr>  <chr>  <chr>        <chr>    <chr>  <chr>      
##  1 THY183   <NA>   4ba9c1 TC-JNA       A332     <NA>   LTBW       
##  2 CES771   MU771  781858 B-30CW       A359     YSSY   EHAM       
##  3 ACA43    <NA>   c0173f C-FIUW       B77W     CYYZ   CYYZ       
##  4 CCA985   CA985  780cb6 B-2485       B748     <NA>   KSFO       
##  5 ETH726   <NA>   040087 ET-ARE       B788     SBGR   LOWW       
##  6 FJI911   FJ911  c8809d DQ-FAJ       A359     KLAX   YSSY       
##  7 HVN11    VN11   888152 VN-A896      A359     <NA>   LFPG       
##  8 UAE363   <NA>   8960e4 A6-EDC       A388     OMDB   OMDB       
##  9 VOI938   Y4938  0d036e XA-VOI       A319     KLAX   KPDX       
## 10 CSN399   <NA>   780f16 B-7185       B77W     <NA>   KJFK       
## # … with 3,921,099 more rows, and 9 more variables: firstseen <dttm>,
## #   lastseen <dttm>, day <dttm>, latitude_1 <dbl>, longitude_1 <dbl>,
## #   altitude_1 <dbl>, latitude_2 <dbl>, longitude_2 <dbl>, altitude_2 <dbl>

Il dataset risultante è formato da 3.921.109 entries e 16 attributi.

Pulizia del dataset

  • Per l’analisi della rete dei voli è essenziale conoscere l’aeroporto di origine e di destinazione del volo. Nel dataset df_flight_covid ci sono 1.600.122 voli con origine e/o destinazione sconosciuta, questi voli non possono essere considerati per l’analisi e sono stati eliminati. Il nuovo dataset ottenuto ha 2.320.977 entries.

  • Le variabili icao24, registration, typecode e number non sono d’interesse per l’analisi e possono essere eliminate.

  • Le variabili firstseen e lastseen possono essere rappresentate dalla variabile day e quindi possono essere rimosse dal dataset.

  • Per identificare univocamente un volo è stato aggiunto un id.

  • Gli attributi relativi a latitudine, longitudine e altitudine del primo e ultimo contatto non sono rilevanti e possono essere eliminati.

  • Il dataset ottenuto ha 5 attributi: id, callsign, origin, destination e day.

## # A tibble: 2,320,987 x 5
##       id callsign origin destination day                
##    <dbl> <chr>    <chr>  <chr>       <dttm>             
##  1     1 CES771   YSSY   EHAM        2020-01-01 00:00:00
##  2     2 ACA43    CYYZ   CYYZ        2020-01-01 00:00:00
##  3     3 ETH726   SBGR   LOWW        2020-01-01 00:00:00
##  4     4 FJI911   KLAX   YSSY        2020-01-01 00:00:00
##  5     5 UAE363   OMDB   OMDB        2020-01-01 00:00:00
##  6     6 VOI938   KLAX   KPDX        2020-01-01 00:00:00
##  7     7 UBG315   WMKK   WMKK        2020-01-01 00:00:00
##  8     8 VOI950   KLAX   KFAT        2020-01-01 00:00:00
##  9     9 SVA834   WMKK   WMKK        2020-01-01 00:00:00
## 10    10 ACA848   VHHH   EGLL        2020-01-01 00:00:00
## # … with 2,320,977 more rows

Dataset aeroporti

Per poter eseguire un’analisi sulla rete dei voli è necessario individuare la nazione (e il continente) dell’aeroporto di partenza e di arrivo del volo. Gli aeroporti sono identificati dalla sigla ICAO che è un codice aeroportuale di quattro lettere.

Queste informazioni possono essere ricavate a partire dalle sigle degli aeroporti di partenza e di arrivo se si ha a disposizione un dataset che mappa tali sigle nelle nazioni di appartenenza dell’aeroporto.

Un dataset con queste informazioni non è scaricabile gratuitamente perciò è stato costruito manualmente a partire dalle informazioni in formato JSON presenti nel sito datahub.io.

Il dataset icao_codes creato ha 57.421 entries ed è caratterizzato dai seguenti 12 attributi:

  • ident: numero ICAO dell’aeroporto;
  • type: tipo di aeroporto;
  • name: nome dell’aeroporto;
  • elevation_ft: altitudine;
  • continent: continente dove si trova l’aeroporto;
  • iso-country: codice iso della nazione;
  • iso-region: codice iso della regione;
  • municipality: comune;
  • gps_code: codice gps;
  • iata_code: codice iata aeroporto;
  • local_code: codice locale;
  • coordinates: coordinate aeroporto.

Di questi attributi sono necessari solo: ident, continent, iso-country e coordinates.

## # A tibble: 57,421 x 12
##    ident type  name  elevation_ft continent iso_country iso_region municipality
##    <chr> <chr> <chr>        <dbl> <chr>     <chr>       <chr>      <chr>       
##  1 00A   heli… Tota…           11 <NA>      US          US-PA      Bensalem    
##  2 00AA  smal… Aero…         3435 <NA>      US          US-KS      Leoti       
##  3 00AK  smal… Lowe…          450 <NA>      US          US-AK      Anchor Point
##  4 00AL  smal… Epps…          820 <NA>      US          US-AL      Harvest     
##  5 00AR  clos… Newp…          237 <NA>      US          US-AR      Newport     
##  6 00AS  smal… Fult…         1100 <NA>      US          US-OK      Alex        
##  7 00AZ  smal… Cord…         3810 <NA>      US          US-AZ      Cordes      
##  8 00CA  smal… Gold…         3038 <NA>      US          US-CA      Barstow     
##  9 00CL  smal… Will…           87 <NA>      US          US-CA      Biggs       
## 10 00CN  heli… Kitc…         3350 <NA>      US          US-CA      Pine Valley 
## # … with 57,411 more rows, and 4 more variables: gps_code <chr>,
## #   iata_code <chr>, local_code <chr>, coordinates <chr>

Dataset finale

Attraverso il join tra il dataset dei voli df_flight_covid e quello degli aeroporti icao_codes è stato possibile ricavare la posizione degli aeroporti di partenza e di arrivo per ogni volo (stato e continente).

Il dataset df_flights_airports ottenuto è formato da 2.315.324 entries e contiene i seguenti attributi:

  • id: che identifica univocamente il volo;
  • callsign: l’identificativo del volo visualizzato sugli schermi ATC (di solito le prime tre lettere sono riservate a una compagnia aerea: AFR per Air France, DLH per Lufthansa, ecc.);
  • origin: identificativo ICAO dell’aeroporto di origine;
  • destination: identificativo ICAO dell’aeroporto di destinazione;
  • day: giorno del volo;
  • continent_origin: sigla del continente di origine;
  • country_origin: sigla della nazione di origine;
  • coordinates_origin: coordinate dell’aeroporto di origine (latitudine e longitudine);
  • continent_dest: sigla del continente di destinazione;
  • country_dest: sigla della nazione di destinazione;
  • coordinates_dest: coordinate dell’aeroporto di destinazione (latitudine e longitudine).
## # A tibble: 2,315,324 x 11
##       id callsign origin destination day                 continent_origin
##    <dbl> <chr>    <chr>  <chr>       <dttm>              <chr>           
##  1     1 CES771   YSSY   EHAM        2020-01-01 00:00:00 OC              
##  2     2 ACA43    CYYZ   CYYZ        2020-01-01 00:00:00 NA              
##  3     3 ETH726   SBGR   LOWW        2020-01-01 00:00:00 SA              
##  4     4 FJI911   KLAX   YSSY        2020-01-01 00:00:00 NA              
##  5     5 UAE363   OMDB   OMDB        2020-01-01 00:00:00 AS              
##  6     6 VOI938   KLAX   KPDX        2020-01-01 00:00:00 NA              
##  7     7 UBG315   WMKK   WMKK        2020-01-01 00:00:00 AS              
##  8     8 VOI950   KLAX   KFAT        2020-01-01 00:00:00 NA              
##  9     9 SVA834   WMKK   WMKK        2020-01-01 00:00:00 AS              
## 10    10 ACA848   VHHH   EGLL        2020-01-01 00:00:00 AS              
## # … with 2,315,314 more rows, and 5 more variables: country_origin <chr>,
## #   coordinates_origin <chr>, continent_dest <chr>, country_dest <chr>,
## #   coordinates_dest <chr>

Analisi esplorativa

Come prima analisi è stata eseguita un’analisi esplorativa del dataset df_flights_airports.

  • Quanti aeroporti ci sono nel dataset? Nel dataset sono presenti 5.330 aeroporti su 17.678 aeroporti commerciali nel mondo (fonte: Airport Council International).
## [1] "Numero di aeroporti presenti nel dataset: 5330"
  • Quante nazioni ci sono nel dataset? Questo dataset copre i voli in 106 nazioni del mondo su 208 nazioni totali.
## [1] "Numero di nazioni nel dataset: 106"
  • Quanti voli internazionali? Sono stati registrati 711.780 voli internazionali, il 30.7% del totale.
## [1] "Numero di voli internazionali registrati: 711780"
  • Tra i voli internazionali, quanti sono anche intercontinentali? 176.150 voli sono intercontinentali (il 24% dei voli internazionali e il 7.6% dei voli totali).
## [1] "Numero di voli intercontinentali registrati: 176150"
  • Quanti voli nazionali? Sono stati registrati 1.603.544, ovvero il 69.3% del totale.
## [1] "Numero di voli nazionali registrati: 1603544"

Distribuzione dei voli

È interessante capire quali sono le nazioni con più voli in partenza e in arrivo e quelle con meno voli in partenza e in arrivo.

  • Da quali nazioni partono più voli?
## # A tibble: 6 x 4
## # Groups:   country_origin [6]
##   country_origin totale_voli nazione       n_aeroporti
##   <chr>                <int> <chr>               <int>
## 1 US                 1380418 USA                  3909
## 2 DE                  100559 Germania               69
## 3 AU                   73172 Australia              88
## 4 CA                   68274 Canada                141
## 5 GB                   63180 Gran Bretagna          63
## 6 IN                   60409 India                  41
  • Da quali nazioni partono meno voli?
## # A tibble: 6 x 4
## # Groups:   country_origin [6]
##   country_origin totale_voli nazione     n_aeroporti
##   <chr>                <int> <chr>             <int>
## 1 ML                       6 Mali                  1
## 2 AZ                       5 Azerbaigian           1
## 3 GT                       5 Guatemala             1
## 4 MR                       3 Mauritania            1
## 5 CY                       2 Cipro                 2
## 6 UY                       1 Uruguai               1
  • Quali sono le nazioni con più voli in arrivo?
## # A tibble: 6 x 4
## # Groups:   country_dest [6]
##   country_dest totale_voli nazione       n_aeroporti
##   <chr>              <int> <chr>               <int>
## 1 US               1380459 USA                  3909
## 2 DE                 98729 Germania               69
## 3 AU                 73064 Australia              88
## 4 CA                 67438 Canada                141
## 5 GB                 62114 Gran Bretagna          63
## 6 IN                 60319 India                  41
  • Quali sono le nazioni con meno voli in arrivo?
## # A tibble: 6 x 4
## # Groups:   country_dest [6]
##   country_dest totale_voli nazione     n_aeroporti
##   <chr>              <int> <chr>             <int>
## 1 AZ                     6 Azerbaigian           1
## 2 MR                     5 Mauritania            1
## 3 KW                     2 Kuwait                1
## 4 OM                     2 Oman                  1
## 5 EG                     1 Egitto                1
## 6 SY                     1 Siria                 1
  • Come sono distribuiti i voli in partenza in base al continente?
  • Come sono distribuiti i voli in arrivo in base al continente?

Distribuzione degli aeroporti

Come sono distribuiti gli aeroporti nei continenti?

La concentrazione maggiore si trova negli Stati Uniti (4096 aeroporti) e in Europa (699 aeroporti) mentre per il continente africano sono presenti solo 45 aeroporti.

Grazie alla mappa interattiva è possibile vedere la disposizione degli aeroporti nel globo e, come già emerso, la concentrazione maggiore è negli Stati Uniti (in particolare nella East Coast) e in Europa. Il continente asiatico e quello africano presentano pochi aeroporti, probabilmente questo è dovuto al fatto che non vengono registrati molti voli da e verso gli aeroporti di quei continenti dalla piattaforma OpenSky Network.

Voli giornalieri

  • Quanti voli giornalieri sono avvenuti nel periodo gennaio-febbraio-marzo 2020?

Dall’analisi del grafico si nota che da inizio marzo c’è stata una drastica diminuzione dei voli a livello globale. Questo calo corrisponde all’entrata in vigore delle misure restrittive che hanno imposto la riduzione (o il blocco totale) dei voli.

L’organizzazione mondiale della sanità (WHO) l’11 marzo dichiara la pandemia.

  • Un valore anomalo si verifica il 18/01/2020 in cui si nota una diminuzione significativa dei voli (19.193 voli rispetto ai 30.150 del giorno prima). Non è chiaro cosa abbia causato questa diminuzione ma potrebbe essere una conseguenza dell’attività di pulizia del dataset.

  • Qual è il giorno con più voli?

Il 14 febbraio sono stati effettuati 31.459 voli, in questo periodo i paesi occidentali non avevano ancora adottato misure di lockdown.

## # A tibble: 1 x 2
## # Groups:   day [1]
##   day                 voli_giornalieri
##   <dttm>                         <int>
## 1 2020-02-14 00:00:00            31459
  • Qual è il giorno con meno voli?

Il 30 marzo è il giorno in cui si sono verificati meno voli (solo 9.209), in questa data gran parte dei paesi occidentali erano in lockdown.

## # A tibble: 1 x 2
## # Groups:   day [1]
##   day                 voli_giornalieri
##   <dttm>                         <int>
## 1 2020-03-30 00:00:00             9209

Voli giornalieri rispetto ai continenti

  • Come sono variati i voli continentali?

In tutti i continenti si è verificata una diminuzione dei voli continentali giornalieri.

  • Com’è variato il numero di voli intercontinentali rispetto al continente di partenza?

Nord America ed Europa

  • Variazione dei voli in partenza dal Nord America e in arrivo in Europa.
  • Variazione dei voli in partenza dall’Europa verso il Nord America.

America e Italia

  • Voli in partenza dall’Italia con destinazione Nord America. Il giorno con più voli su questa tratta è stato il 4 gennaio con 14 voli mentre dal 17 marzo a fine mese c’è stato solo un volo giornaliero.
  • Voli in arrivo in Italia dal Nord America. Il giorno con più voli su questa tratta è stato il 5 gennaio con 13 voli mentre dal 12 marzo a fine mese c’è stato solo un volo giornaliero.

Voli da e per l’Europa

  • Come sono diminuiti i voli in arrivo in Europa dagli altri continenti?
  • Variazione dei voli in partenza dall’Europa verso gli altri continenti.

Voli da e per il Nord America

  • Variazione del numero di voli in arrivo nel Nord America in base al continente di partenza.
  • Numero di voli in partenza dal Nord America verso altri continenti.

Confronto con il 2019

Per poter effettuare un confronto con i mesi di gennaio, febbraio, marzo 2019 e 2020 è stato creato un ulteriore dataset df_flights_airports_2019 con le stesse procedure effettuate per la creazione del dataset per i voli del 2020.

Il grafico del 2019 ha in media un numero minore di voli giornalieri (probabilmente dovuto all’attività di raccolta di dati) ma l’andamento non evidenzia significative diminuzioni cosa che invece è evidente per il 2020.

Rete dei voli

È possibile utilizzare le informazioni sui voli per creare un grafo diretto in cui i nodi sono gli aeroporti e gli archi sono i voli. Il grafo ottenuto ha 5.330 nodi (il numero degli aeroporti) e 2.315.324 archi (ovvero il numero di righe del dataset df_flights_airports).

Su questo grafo sono state calcolate tre misure di centralità dei nodi ovvero in degree, out degree e betweenness con lo scopo di individuare gli aeroporti più popolari e quelli più di transito.

  • Quali sono gli aeroporti più popolari per i voli in arrivo, ovvero con in degree maggiore? Gli aeroporti più popolari si trovano tutti negli Stati Uniti.
## # A tibble: 10 x 5
##    aeroporto in_degree name                           iso_country municipality  
##    <chr>         <dbl> <chr>                          <chr>       <chr>         
##  1 KORD          68001 Chicago O'Hare International … US          Chicago       
##  2 KATL          61270 Hartsfield Jackson Atlanta In… US          Atlanta       
##  3 KLAX          46795 Los Angeles International Air… US          Los Angeles   
##  4 KDFW          45474 Dallas Fort Worth Internation… US          Dallas-Fort W…
##  5 KPHX          39664 Phoenix Sky Harbor Internatio… US          Phoenix       
##  6 KSFO          35654 San Francisco International A… US          San Francisco 
##  7 KLAS          34910 McCarran International Airport US          Las Vegas     
##  8 KBOS          34360 General Edward Lawrence Logan… US          Boston        
##  9 KEWR          34143 Newark Liberty International … US          Newark        
## 10 KSEA          33631 Seattle Tacoma International … US          Seattle

Analizzando la distribuzione degli in_degree si scopre che 62 aeroporti hanno un in degree superiore a 10.000 mentre i rimanenti 5.268 hanno un in_degree inferiore. Inoltre si nota che la distribuzione degli in_degree non segue precisamente una legge di potenza e che la rappresentazione migliore è con la distribuzione log-normale.

  • Quali sono gli aeroporti più popolari per i voli in partenza, ovvero con out degree maggiore?
## # A tibble: 10 x 5
##    aeroporto out_degree name                          iso_country municipality  
##    <chr>          <dbl> <chr>                         <chr>       <chr>         
##  1 KORD           72575 Chicago O'Hare International… US          Chicago       
##  2 KATL           68496 Hartsfield Jackson Atlanta I… US          Atlanta       
##  3 KLAX           54705 Los Angeles International Ai… US          Los Angeles   
##  4 KDFW           50718 Dallas Fort Worth Internatio… US          Dallas-Fort W…
##  5 KDEN           45810 Denver International Airport  US          Denver        
##  6 KPHX           41341 Phoenix Sky Harbor Internati… US          Phoenix       
##  7 KLAS           36573 McCarran International Airpo… US          Las Vegas     
##  8 KSFO           36001 San Francisco International … US          San Francisco 
##  9 KBOS           35693 General Edward Lawrence Loga… US          Boston        
## 10 KSEA           35654 Seattle Tacoma International… US          Seattle

Analizzando la distribuzione out_degree si scopre che 1.154 aeroporti hanno un out degree superiore a 10.000 e che la distribuzione non segue precisamente una legge di potenza e che la rappresentazione migliore è con la distribuzione log-normale.

I 4 aeroporti più popolari sia per in degree che per out degree sono: Chicago O’Hare International Airport, Hartsfield Jackson Atlanta International Airport, Los Angeles International Airport e Dallas Fort Worth International Airport. Questi aeroporti corrispondono agli scali più trafficati degli Stati Uniti.

  • Quali sono gli aeroporti più di transito?
## # A tibble: 10 x 5
##    aeroporto     btw name                             iso_country municipality  
##    <chr>       <dbl> <chr>                            <chr>       <chr>         
##  1 KORD       1.99e6 Chicago O'Hare International Ai… US          Chicago       
##  2 KATL       1.37e6 Hartsfield Jackson Atlanta Inte… US          Atlanta       
##  3 KDFW       1.29e6 Dallas Fort Worth International… US          Dallas-Fort W…
##  4 KMSP       6.49e5 Minneapolis-St Paul Internation… US          Minneapolis   
##  5 KLAX       6.49e5 Los Angeles International Airpo… US          Los Angeles   
##  6 EDDF       6.01e5 Frankfurt am Main Airport        DE          Frankfurt am …
##  7 KPHL       5.96e5 Philadelphia International Airp… US          Philadelphia  
##  8 KIAH       5.73e5 George Bush Intercontinental Ho… US          Houston       
##  9 KCLT       5.70e5 Charlotte Douglas International… US          Charlotte     
## 10 KEWR       5.22e5 Newark Liberty International Ai… US          Newark

I tre aeroporti più di transito corrispondono ai tre aeroporti più popolari.

Variazione delle misure di centralità

Come sono variate le misure di centralità di gennaio e di marzo, ovvero prima e dopo l’inizio della pandemia? Le misure di centralità fin’ora calcolate si basano su tutto il periodo gennaio-marzo 2020.

Calcolando le misure di centralità nei singoli mesi di gennaio e marzo è possibile osservare come queste siano cambiate (ovvero diminuite) con l’inizio della pandemia.

  • Qual è la variazione percentuale di in_degree di ogni aeroporto? Quale aeroporto ha avuto la variazione maggiore?
## # A tibble: 3,539 x 6
##    aeroporto name            municipality  in_degreegennaio in_degreemarzo   var
##    <chr>     <chr>           <chr>                    <dbl>          <dbl> <dbl>
##  1 LPAR      Alverca Air Ba… Vila Franca …              877              0  -100
##  2 OLBA      Beirut Rafic H… Beirut                     756              0  -100
##  3 KPWA      Wiley Post Air… Oklahoma City              732              0  -100
##  4 MMUN      Cancún Intern… Cancún                    511              0  -100
##  5 SEHI      Cotachachi Air… Cotacachi                  395              0  -100
##  6 KCAE      Columbia Metro… Columbia                   368              0  -100
##  7 KTIK      Tinker Air For… Oklahoma City              206              0  -100
##  8 RJOT      Takamatsu Airp… Takamatsu                  187              0  -100
##  9 MMCZ      Cozumel Intern… Cozumel                    163              0  -100
## 10 KN52      Jaars Townsend… Waxhaw                     122              0  -100
## # … with 3,529 more rows
  • Qual è la variazione percentuale di out_degree di ogni aeroporto? Quale aeroporto ha avuto la variazione maggiore?
## # A tibble: 1,894 x 6
##    aeroporto name           municipality  out_degreegenna… out_degreemarzo   var
##    <chr>     <chr>          <chr>                    <dbl>           <dbl> <dbl>
##  1 OLBA      Beirut Rafic … Beirut                     700               0  -100
##  2 KCAE      Columbia Metr… Columbia                   413               0  -100
##  3 KOKC      Will Rogers W… Oklahoma City              256               0  -100
##  4 RJOT      Takamatsu Air… Takamatsu                  196               0  -100
##  5 LTBW      İstanbul Hez… Istanbul                   156               0  -100
##  6 MMCZ      Cozumel Inter… Cozumel                    139               0  -100
##  7 MMUN      Cancún Inter… Cancún                    121               0  -100
##  8 VOTV      Trivandrum In… Thiruvananth…              109               0  -100
##  9 KTIK      Tinker Air Fo… Oklahoma City               99               0  -100
## 10 SEAS      Ascazubi Airp… Ascazubi                    93               0  -100
## # … with 1,884 more rows
  • Qual è la variazione percentuale di betweenness centrality di ogni aeroporto? Quale aeroporto ha avuto la variazione maggiore?
## # A tibble: 4 x 6
##   aeroporto name                    municipality     btw_gennaio btw_marzo   var
##   <chr>     <chr>                   <chr>                  <dbl>     <dbl> <dbl>
## 1 KCAE      Columbia Metropolitan … Columbia              10262.         0  -100
## 2 KNSI      San Nicolas Island Nol… San Nicolas Isl…       7227.         0  -100
## 3 SWJX      Fazenda das Perobas Ai… Prudente De Mor…       7053.         0  -100
## 4 44PA      Pennfield Farm Airport  Spring Mills           7049.         0  -100

Visualizzazioni dei voli

È possibile visualizzare la mappa dei voli nei tre mesi di gennaio, febbraio e marzo 2020. Per una migliore visualizzazione della mappa è stata considerata la rete in cui ogni nodo è un aeroporto e c’è un arco tra due aeroporti se c’è stato almeno un volo ma non sono ripetuti archi se ci sono stati più voli tra due nodi.

  • Come cambia la mappa dei voli tra gennaio e marzo 2020?

Mappa gennaio 2020:

Mappa marzo 2020:

Visualizzazione della mappa dei voli tra Nord America e Europa in due date stabilite: 7 gennaio (prima dell’inizio della pandemia) e 25 marzo (durante la pandemia).

  • Voli tra Nord America ed Europa del 7 gennaio.

  • Voli tra Nord America ed Europa del 25 marzo. Ripetiamo la stessa analisi considerando solo i voli nazionali italiani.

  • Voli nazionali italiani del 7 gennaio.

  • Voli nazionali italiani del 25 marzo.

Componente gigante

In questa rete di voli è presente una componente gigante, ovvero una componente connessa “gigante” formata da un insieme di aeroporti che sono connessi tra di loro da voli?

La componente gigante esiste ed è formata da 1.779.291 archi su 2.315.324 archi totali e da 4.077 aeroporti su 5.330 aeroporti presenti nel dataset (76.5% degli aeroporti).

##   aeroporto1      lat1      lon1 aeroporto2     lat2      lon2
## 1       WMKK 101.71000   2.74558       KLAX -118.408  33.94250
## 2       VHHH 113.91500  22.30890       WMKK  101.710   2.74558
## 3       YPPH 115.96700 -31.94030       KLAX -118.408  33.94250
## 4       WSSS 103.99400   1.35019       WMKK  101.710   2.74558
## 5       KCVG -84.66780  39.04880       VHHH  113.915  22.30890
## 6       EHAM   4.76389  52.30860       YPPH  115.967 -31.94030

Considerando solo i voli di gennaio la componente gigante è di 33.300 archi (su 845.899) e 3.898 aeroporti.

Considerando solo i voli di marzo la componente gigante è di 31.895 archi (su 647.463) e 3.769 aeroporti.

Ricerca di comunità

È possibile individuare delle comunità in questa rete di voli, ovvero insiemi di aeroporti che sono densamente connessi tra di loro e poco connessi con aeroporti di altre comunità?

Per la ricerca di comunità sono stati applicati diversi algoritmi ed è stato scelto, per le analisi successive, quello con una modularità maggiore.

  • Considerando solo i voli del mese di gennaio il risultato migliore si ottiene con l’algoritmo cluster_louvain con una modularità di 0.53 e 18 comunità individuate.
##            algoritmo modularità
## 1    cluster_infomap       0.02
## 2   cluster_walktrap       0.50
## 3    cluster_louvain       0.53
## 4 cluster_label_prop       0.48

La comunità più grande è formata da 2.290 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16 
##   88  167 2290  566  676   82    6    8    3    1    1    2    2    2    2    2 
##   17   18 
##    2    2

Visualizzazione delle tre comunità più grandi nella rete dei voli di gennaio (pre-covid).

Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2.290 nodi e in rosa la seconda comunità più grande formata da 676 nodi. Una terza comunità con 566 nodi e rappresentata dal colore corallo è centrata in Europa.

  • Considerando solo i voli del mese di marzo il risultato migliore si ottiene con l’algoritmo cluster_louvain con una modularità di 0.47 e 17 comunità individuate.
##            algoritmo modularità
## 1    cluster_infomap       0.02
## 2   cluster_walktrap       0.42
## 3    cluster_louvain       0.47
## 4 cluster_label_prop       0.41

Delle 17 comunità individuate la più grande è formata da 2.201 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16 
##   80 2201  615  167   83    7  587    2    1    3   13    6    2    2    2    3 
##   17 
##    3

Visualizzazione delle tre comunità più grandi nella rete dei voli di marzo (durante il lockdown).

Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2.201 nodi e in rosa la seconda comunità più grande formata da 615 nodi. Una terza comunità con 578 nodi e rappresentata dal colore corallo è centrata in Europa.

  • Considerando i voli di gennaio, febbraio e marzo la modularità maggiore si ottiene con cluster_louvain con un valore di 0.51.
##            algoritmo modularità
## 1    cluster_infomap       0.01
## 2    cluster_louvain       0.51
## 3 cluster_label_prop       0.46

Tra le 15 comunità individuate la più grande è formata da 3.091 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15 
##  113  187 3091    8  797  984    4   14    1  120    2    2    2    2    3

Visualizzazione delle sei comunità più grandi nella rete.

Dalla mappa si nota che sono presenti due comunità negli Stati Uniti, una comunità in Europa, una comunità in Oceania, una tra India e Cina e una in Sud America.

Conclusioni

  • Il Covid-19 ha causato una riduzione dei voli a livello mondiale. A gennaio 2020 sono stati registrati 845.899 voli mentre a marzo 2020 i voli sono stati 647.463 con una riduzione del 23.5% rispetto a gennaio.
  • La pandemia ha avuto effetti sui voli in tutti i continenti a partire da marzo 2020.
  • Il dataset non comprendeva informazioni sui voli in Cina, sarebbe stato interessante eseguire la stessa analisi per i voli cinesi.
  • A causa del Covid-19 sono diminuite le centralità di grado e di betweenness degli aeroporti, ma gli aeroporti più popolari sono rimasti gli stessi.
  • Analizzando le comunità nella rete dei voli si delineano comunità che corrispondono ai continenti.